home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / ietf / urn / urn-archives / urn-ietf.archive.9611 / 000097_owner-urn-ietf _Thu Nov 7 11:35:09 1996.msg < prev    next >
Internet Message Format  |  1997-02-19  |  4KB

  1. Received: (from daemon@localhost) by services.bunyip.com (8.6.10/8.6.9) id LAA29180 for urn-ietf-out; Thu, 7 Nov 1996 11:35:09 -0500
  2. Received: from mocha.bunyip.com (mocha.Bunyip.Com [192.197.208.1]) by services.bunyip.com (8.6.10/8.6.9) with SMTP id LAA29175 for <urn-ietf@services.bunyip.com>; Thu, 7 Nov 1996 11:35:07 -0500
  3. Received: from josef.ifi.unizh.ch by mocha.bunyip.com with SMTP (5.65a/IDA-1.4.2b/CC-Guru-2b)
  4.         id AA22622  (mail destined for urn-ietf@services.bunyip.com); Thu, 7 Nov 96 11:34:12 -0500
  5. Received: from ifi.unizh.ch by josef.ifi.unizh.ch 
  6.           id <00889-0@josef.ifi.unizh.ch>; Thu, 7 Nov 1996 17:30:38 +0100
  7. Subject: Re: [URN] I18N does not belong in URNs
  8. To: girod@LCS.MIT.EDU
  9. Date: Thu, 7 Nov 1996 17:30:37 +0100 (MET)
  10. Cc: tallen@fsc.fujitsu.com, moore@cs.utk.edu, urn-ietf@bunyip.com
  11. In-Reply-To: <9611062348.AA06182@skadhwe.lcs.mit.edu> from "Lewis Girod" at Nov 6, 96 06:48:00 pm
  12. Mime-Version: 1.0
  13. Content-Type: text/plain; charset=US-ASCII
  14. Content-Transfer-Encoding: 7bit
  15. Content-Length: 2326
  16. From: Martin J Duerst <mduerst@ifi.unizh.ch>
  17. Message-Id: <"josef.ifi..250:07.10.96.16.30.39"@ifi.unizh.ch>
  18. Sender: owner-urn-ietf@services.bunyip.com
  19. Precedence: bulk
  20. Reply-To: Martin J Duerst <mduerst@ifi.unizh.ch>
  21. Errors-To: owner-urn-ietf@bunyip.com
  22.  
  23. Lewis Girod wrote:
  24.  
  25. >   this group seriously would agree to restrict URNs to digits
  26. >   only for this reason, I would understand.
  27. >   But with ASCII as a "restricted" character set, we will definitely
  28. >   get cruftiness, and I see no reason to allow cruftiness for
  29. >   English, but to deny it for most other languages.
  30. >
  31. >One idea we were experimenting with here was to use a subset of ASCII
  32. >that included only numerals, punctuation and consonants, which would
  33. >make most words hard to express (at least in some languages).
  34.  
  35. There are some languages that use mostly consonants, esp. some
  36. of the Slavic languages. Arabic and Hebrew in principle write only
  37. consonants. But I am less worried about these aspects.
  38.  
  39. What I am worried about is that we just exclude 5 letters from 26.
  40. This may not be noticed by some people, who happily will use
  41. AEIOU also. We have this now, as for example "~" seems to be
  42. unsafe or excluded, but still is used all the time.
  43.  
  44. Also, many accronyms contain only consonants (e.g. HTML and HTTP),
  45. and if somebody wants to use words with vowels stripped, it
  46. will unduely give advantages to some and disadvantages to others.
  47. For example, compare mcrsft, ppl, bm, dgtl, hp, sn, and so on.
  48.  
  49. So just cutting out the vowels is not enough if we want to go
  50. that way; for a small set, my preference would still be for
  51. 0123456789#* (phone keys). Of course, my general preference is
  52. for full i18n with UTF-8.
  53.  
  54.  
  55. >   The interesting thing is that we already have that, in the current
  56. >   syntax draft. Just call the readable form of it UFNs, and call
  57. >   the encoded form, %HH-escaped, URNs. I have proposed similar
  58. >   names for these things, namely IRNs (internationalized ...).
  59. >
  60. >True, those strings are hard to read but it doesn't solve the problem
  61. >because the URN and the UFN are tightly coupled -- the whole point of
  62. >UFNs is that they are nicknames with a short lifespan.  A UFN should
  63. >be allowed to change over time without ever changing the aliased URN.
  64.  
  65. I didn't want to stress that the %HH strings are difficult to read.
  66. What I a looking for in UFNs is that they are user friendly, i.e.
  67. easy to understand and type in by somebody e.g. in Japan or so,
  68. and that they are tightly coupled to something else, e.g. URNs
  69. or URLs, so that they can be resolved quickly and deterministically.
  70.  
  71. Regards,    Martin.